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1. GENERALIDADES 


1.1. INTRODUCAO 


Por onde quer que se olhe ou escute uma coleção de números são normalmente enunciados 
como estatísticas. Estes números referem-se aos mais diversos campos de atividades: esportes, 
economia, financas, etc. Assim tem-se por exemplo: 


e O número de carros vendidos no país aumentou em 30%. 

e À taxa de desemprego atinge, hoje, 7,5%. 

e As ações da Telebrás subiram R$ 1,5, hoje. 

e Resultados do Carnaval no trânsito: 145 mortos, 2430 feridos. 


Um número é denominado uma estatística (singular). No fechamento da bolsa as ações da 
Vale foram cotadas a R$ 45.50. As vendas de uma empresa no mês constituem uma estatística. Já uma 
coleção de números ou fatos é denominado de estatísticas (plural). Por exemplo, As vendas da 
empresa Picuínhas totalizaram: 2,5 milhões em janeiro, 2,7 em fevereiro e 3.1 em marco. No entanto o 
termo Estatística tem um sentido muito mais amplo, do que apenas números ou coleção de números. A 
Estatística pode ser definida como: 


A ciência de coletar, organizar, apresentar, analisar e interpretar dados numéricos com 
o objetivo de tomar melhores decisões. 


Assim como advogados possuem “regras de evidência” e contabilistas possuem “práticas 
comumente aceitas”, pessoas que tratam com dados numéricos seguem alguns procedimentos padrões. 
Alguns destes métodos serão vistos no que se denomina de estatística descritiva. 


1.2. DIVISÃO DA ESTATÍSTICA 


A Estatística que lida com a organização, resumo e apresentação de dados numéricos é 
denominada de Estatística Descritiva. Assim pode-se definir a Estatística Descritiva como sendo: 


Os procedimentos usados para organizar, resumir e apresentar dados numéricos. 


Conjuntos de dados desorganizados são de pouco ou nenhum valor. Para que os dados se 
transformem em informação é necessário organizá-los, resumi-los e apresentá-los. O resumo de 
conjuntos de dados é feito através das medidas e a organização e apresentação através das distribuições 
de frequências e dos gráficos ou diagramas. 


Estatística Indutiva. Muitas vezes, apesar dos recursos computacionais e da boa vontade não 
é possível estudar todo um conjunto de dados de Interesse. Neste caso estuda-se uma parte do conjunto. 
O principal motivo para se trabalhar com uma parte do conjunto ao invés do conjunto Inteiro é o custo. 


O conjunto de todos os elementos que se deseja estudar é denominado de população. Note-se 
que o termo população é usado num sentido amplo e não significa, em geral, conjunto de pessoas. 
Pode-se definir uma população como sendo: 

Uma coleção de todos os possíveis elementos, objetos ou medidas de interesse. 

Assim, são exemplos de populações: 

1. O conjunto das rendas de todos os habitantes de Porto Alegre; 


2. O conjunto de todas as notas dos alunos de Estatística; 
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3. O conjunto das alturas de todos os alunos da Universidade; etc. 


Fazer levantamentos, estudos, pesquisas, sobre toda uma população (censo) é, em geral, muito 
difícil. Isto se deve à vários fatores. O principal é o custo. Um censo custa muito caro e demanda um 
tempo considerável para ser realizado. Assim, normalmente, se trabalha com partes da população 
denominadas de amostras. Uma amostra pode ser caracterizada como: 


Uma porção ou parte de uma população de interesse. 


Utilizar amostras para se ter conhecimento sobre populações é realizado intensamente na 
Agricultura, Política, Negócios, Marketing, Governo, etc., como se pode ver pêlos seguintes exemplos: 


e Antes da eleição diversos órgãos de pesquisa e imprensa ouvem um conjunto selecionado de 
eleitores para ter uma idéia do desempenho dos vários candidatos nas futuras eleições. 


e Uma empresa metal-mecânica toma uma amostra do produto fabricado em intervalos de 
tempo especificados para verificar se o processo está sob controle e evitar a fabricação de itens 
defeituosos. 


e O IBGE faz levantamentos periódicos sobre emprego, desemprego, inflação, etc. 


e Redes de rádio e tv se utilizam constantemente dos índices de popularidade dos programas 
para fixar valores da propaganda ou então modificar ou eliminar programas com audiência 
insatisfatória. 


e Biólogos marcam pássaros, peixes, etc. para tentar prever e estudar seus hábitos. 


O processo de escolha de uma amostra da população é denominado de amostragem. 


Riscos da amostragem. O processo de amostragem envolve riscos, pois toma-se decisões 
sobre toda a população com base em apenas uma parte dela. A teoria da probabilidade pode ser 
utilizada para fornecer uma idéia do risco envolvido, ou seja, do erro que se comete ao utilizar uma 
amostra ao invés de toda a população, desde que, é claro, a amostra seja selecionada através de 
critérios probabilísticos, Isto é, ao acaso. 


Baseado nos conceitos anteriores pode-se definir Estatística Indutiva ou Inferencial como: 


A coleção de métodos e técnicas utilizados para se estudar uma população baseados em 
amostras probabilísticas desta mesma população. 


1.3. MENSURAÇÃO 


1.3.1. INTRODUÇÃO 


O processo de selecionar o modelo matemático ou estatístico a ser utilizado com uma dada 
técnica de pesquisa ou procedimento operacional envolve algumas decisões importantes. A tomada de 
decisão do modelo matemático ou estatístico a ser aplicado costuma ser precedida pela mensuração do 
fenômeno envolvido. E uma primeira dificuldade surge na necessidade de se definir o que é 
mensuração. Se o termo se referir somente aqueles tipos de medidas comumente utilizados em ciências 
tais como a física (por exemplo: medidas de comprimento, massa ou tempo) não haverá muitos 
problemas na escolha do sistema matemático. Mas se o conceito de medida for amplo o suficiente para 
incluir certos procedimentos de categorização normalmente utilizados em Ciências Sociais, então o 


Prof. Lorí Viali, Dr. — vialiOmat.pucrs.br - http://www.mat.pucrs.br/-lori/ 5 


SÉRIE: Estatística Básica 
Texto 1: DESCRITIVA 





problema torna-se mais complexo. Pode-se distinguir entre diversos níveis de mensuracáo e para cada 
um existem diferentes modelos estatísticos apropriados. 


1.3.2. FORMAS DE MENSURAÇÃO 


Existem quatro formas de mensuração ou tipos ou níveis de medidas ou ainda escalas que são 
conhecidas como: nominal, ordinal, intervalar e razáo. 


Nível nominal. A operacáo básica e mais simples em qualquer ciéncia é a de classificacáo. Na 
classificacáo tenta-se separar conjuntos de elementos com respeito a certas categorias, tomando 
decisões sobre quais elementos são mais parecidos e quais são diferentes. O objetivo é colocar os 
elementos em categorias tão homogêneas quanto possível quando comparados com as diferenças 
existentes entre as categorias. 


Os termos nível nominal de medida ou escala nominal são utilizadas para se referir a aqueles 
dados que só podem ser classificados em categorias. Se bem que no sentido estrito não existe na 
realidade uma medida ou escala envolvida. Existe apenas uma contagem. Variáveis que podem ser 
colocadas nesta categoria são, por exemplo, a classificação das pessoas quanto à religião, sexo, estado 
civil, etc. Não existe uma ordem particular entre as categorias ou grupos e além disso duas categorias 
quaisquer são mutuamente excludentes, isto é, uma pessoa não pode ser ao mesmo tempo católico e 
protestante. Além disso as categorias são exaustivas, significando que um membro da população deve 
aparecer em uma e somente uma das categorias. Observe a tabela um abaixo. 


Tabela 1.1 - Exemplo de variável nominal 


Estado civil Número de pessoas 
Casado 340 
Solteiro 250 

Viúvo | 40 

Divorciado 50 

Total 700 


Deve-se ser salientado que as classes ou categorias podem ser rotuladas com números, mas 
Isto não significa as operações aritméticas com estes números tenham algum significado em particular. 
Neste caso os números exercem a mesma função dos nomes, isto é, identificar a categoria. 


Nível ordinal. O nível ordinal é o tipo nominal em que se pode ordenar as categorias. A única 
diferença entre os dois níveis é a relação de ordem que se pode estabelecer entre as categorias. No 
entanto, não é possível afirmar o quanto uma categoria é maior do que a anterior, isto é, não se pode 
afirmar o quanto uma categoria possui da característica. A avaliação através de conceitos é feita por 
uma escala ordinal. Veja um exemplo na tabela dois abaixo. 


Tabela 1.2 - Exemplo de variável em escala ordinal 


Conceitos Número de alunos 
A | 4 
B 6 
C | 15 
D 3 
E | 2 
Total 30 


Prof. Lorí Viali, Dr. — viali@mat.pucrs.br - http://www.mat.pucrs.br/~lori/ 6 


SÉRIE: Estatística Básica 
Texto 1: DESCRITIVA 





Não se pode afirmar neste caso que quem tirou A teve um número de acertos duas vezes 
maior que quem tirou C. A única coisa que se sabe é que quem tem A acertou mais questões do quem 
tem B e este de quem tem C e assim por diante. As famílias podem ser classificadas de acordo com seu 
estatus sócio econômico em: alta, média alta, média, média baixa, baixa. Não é possível entretanto 
afirmar que a diferença entre a alta e a média alta seja a mesma que entre a média e a média baixa. 


Nível intervalar. No sentido estrito da palavra o termo mensuração pode ser utilizado para se 
referir a situações em que se pode, não somente ordenar objetos com respeito ao grau de que eles 
possuem certa característica, mas também indicar a exata distância entre eles. Isto é possível através de 
uma escala denominada de "escala de intervalos". 


A escala de medida intervalar é uma escala nominal em que a distáncia entre as categorias, ao 
contrário da ordinal, é sempre a mesma. Ou seja, ela possui todas as características da escala ordinal 
mais o fator de que a distáncia entre as diversas categorias (ou valores) é sempre constante. As escalas 
de medir temperaturas como a Fahrenheit e a Celsius são exemplos de escalas de intervalo. No entanto, 
náo se pode afirmar que uma temperatura de 40 graus é duas vezes mais quente que uma de 20 graus, 
embora se possa dizer que a diferença entre 20 graus e 40 graus é a mesma que entre 75 graus e 95 
graus. Isto porque este tipo de escala não possui um zero absoluto. Ou seja o valor zero na escala é 
apenas um ponto de referência e não significa a ausência de calor. Escores padronizados são também 
exemplos deste tipo de nível de medida. 


Torna-se evidente que uma escala de Intervalo requer o estabelecimento de algum tipo de 
unidade física a qual todos concordem, isto é, um padrão, e, que seja replicável, isto é, possa ser 
aplicada muitas vezes e fornecendo sempre os mesmos resultados. Comprimento é medido em termos 
de cm ou metros, tempo em segundos, temperatura em centígrados ou Fahrenheit, renda em dólar ou 
reais. Por outro lado não existem tais unidades para inteligência, autoritarismo ou prestígio que sejam 
unânimes entre todos os cientistas sociais e que possam ser assumidas constantes de uma situação para 
outra. 


Nível de razão. Este é o mais alto nível de medida. É caracterizado por apresentar todas as 
características da escala intervalar mais um zero absoluto. Aqui o zero pode ser entendido como a 
ausência da característica e as comparações de valor (razão) tem sentido. Um exemplo de variável 
deste tipo é o peso. Um valor igual a zero significa ausência de peso e um valor de 20 kg é duas vezes 
mais pesado que um de 10 kg. 
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Wile 
2. RESUMO DE PEQUENOS CONJUNTOS DE DADOS 


2.1. INTRODUÇÃO 


Para se analisar um conjunto de valores é necessário primeiramente, para fins de notação, 
distinguir se este conjunto é resultado de um censo ou de uma amostragem. 


A Estatística Descritiva pode ser estudada considerando os conjuntos de valores analisados 
como sendo amostras ou então populações. Como o caso mais comum é a obtenção de amostras a 
notação apresentada será feita considerando os valores como resultados de amostragens. No entanto, 
convém ficar atento, com a bibliografia, pois dependendo do autor a orientação pode ser outra. A 
diferença, considerada do ponto de vista da descrição dos dados, é apenas notacional. Assim o tamanho 
de uma população (quando finita) é representado, normalmente por “N”, enquanto que o tamanho de 
amostra é representado por “n”. Afora algumas exceções os valores calculados na amostra são 
representados por letras latinas enquanto que os correspondentes na população o são pelas mesmas 
letras só que gregas. 


Para facilitar o estudo da Estatística Descritiva os conjuntos de valores serão considerados 
como pequenos e grandes. Assim se um conjunto tiver 30 ou menos valores a análise será feita sem o 
agrupamento. Caso o conjunto tenha mais do que 30 valores então primeiramente será feito o 
agrupamento de acordo com o tipo de variável considerada. O valor 30 é apenas um ponto de 
referência escolhido arbitrariamente e dependendo da situação pode-se considerar o agrupamento com 
mais ou menos valores envolvidos. 


Um conjunto de dados, de qualquer tamanho, pode ser resumido de acordo com as seguintes 
medidas: 


1. Medidas de tendência central ou posição 
2. Medidas de dispersão ou variabilidade. 
3. Medidas de assimetria. 

4. Medidas de achatamento ou curtose. 


2.2. MEDIDAS DE POSIÇÃO OU TENDÊNCIA CENTRAL 


Um conjunto de valores (amostra) será representada por: X1, X25 «es Xn, onde “n” é o número 
de elementos do conjunto, isto é, o tamanho da amostra. 


2.2.1. AS MÉDIAS 


(a) A média aritmética 


A média aritmética do conjunto Xy, X2, ..., Xn é representada por X e calculada por: 


X = (X1 + X2 +... + Xn) / n= Yi 
n 


(b) A média geométrica 


A média geométrica dos valores positivos: X1, X2, ..., Xn, é representada por m, e calculada por: 


Mo = N X4 X2 +... Xp = N Tx; 
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(c) A média harmônica 


A média harmônica dos valores positivos X1, X2, ..., Xn é representada por m, e calculada por: 











me 1 o n o n 
11 1 1 1 1/01 
di T y A > DA 
Xi X2 Xn Xi X2 Xn Xi 

n 


Observando a expressáo do cálculo da média harmónica pode-se verificar que ela é definida 
como sendo: O inverso da média aritmética dos inversos. 


Calcular as médias dos seguintes conjuntos de dados: 
(a 1 9 (b) 4 6 (c) 12 4/5 3/2 7/4 
Para o conjunto em (a) tem-se: 
X =(1+9)/2=5 m, = 419 =/9 =3 mM p=2/(1 + 1/9)= 18/10 = 1,80 
Para o conjunto em (b) tem-se: 


X =(4+6)/2=5 M, = 446 =424 =4,90 Mp =2/(1/4 + 1/6) = 24/5 = 4,80 
Para o conjunto em (c) tem-se: 


X = [1/2 + 4/5 + 3/2 + 7/4] / 4 = 91/80 = 1,14 m, = 4|- E SL too = 102 





2592 
4 4 336 
mM = —— DO DD D 
h=% > 5 2 4 377 377 Sao 
+ ++ 
1 4 3 7 84 


Relação entre as três médias 


As três médias mantém a seguinte relação entre elas, desde que os valores sejam positivos e 
diferentes entre si. 


(d) A média quadrática 
A média geométrica dos valores positivos: X1, X2, ..., Xn, é representada por mą e calculada por: 


2 2 2 2 
Xi TX TaT Xa = Xx 
n n 


My = 


(e) A média aritmética ponderada 

A média aritmética ponderada do conjunto xy, X2, ..., Xk, COM pesos wi, W2, ..., Wk, É 
representada por ma, e calculada por: 
2 XiWi 


2 Wi 


ma, = (X1 W1 + X2 W2 +... + Xn Wk) / (W1 + W2 + ...+ Wo) = 


(f) A média geométrica ponderada 


A média geométrica ponderada do conjunto xy, X2, ..., Xk, COM pesos Wi, W2, ..., Wk, 
representada por mg, e calculada por: 


Oy 
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_w; 
Mgp = "YX X2 Xk" 


(g) A média harmônica ponderada 


A média harmônica ponderada do conjunto X1, X2, ..., Xk COM pesos wi, W2, ..., Wk, É 
representada por mh, e calculada por: 


A média da primeira prova de Estatística da turma 135 foi de 6,0 e foi realizada por 55 alunos. 
Na segunda prova compareceram 50 alunos que tiveram uma média de 6,5. A terceira prova realizada 
por 40 alunos teve média de 5,5. Qual a média aritmética geral das 3 provas? 


Mp = LX Wi = (6,0.55 + 6,5.50 + 5,5.40) / (55 + 50 + 40) = 875 / 145 = 6,03. 


2 Wi 
2.2.2. A MEDIANA 


A mediana de um conjunto ordenado de valores, anotada por me, é definida como sendo o 
valor que separa o conjunto em dois subconjuntos do mesmo tamanho. Assim se “n” (número de 
elementos) é ímpar a mediana é o valor central do conjunto. Caso contrário a mediana é a média dos 
valores centrais do conjunto. Tem-se: 


Me = Xm+1m Se “n” é ímpar e me = [Xm + Xn/2)+1]/ 2 se “n” é par 


Para o conjunto: 
15 18 21 32 45 46 49 
A mediana é: 
Me = X(7+1)2 = X4 = 32, 
Ou seja, a mediana é o quarto valor na seqüência ordenada de elementos. 
Se o conjunto acima fosse: 
15 18 21 32 45 46 


Então a mediana seria: 
Me = [X (0/2) + X(1/2)+1] [2 = [X(6/2) T X(6/2)+1] LL (X3 F X4) AS (21 F 32) [2532 = 26,50 


2.2.3. A MODA 


A moda de um conjunto de valores, anotada por mo, é definida como sendo “o valor (ou os 
valores) do conjunto que mais se repete”. Convém lembrar que a moda ao contrário da mediana e da 
média pode não ser única, isto é, um conjunto pode ser bimodal, trimodal, etc. ou mesmo amodal (sem 


moda). Se a moda existir será representada por Mo. 


Dado o conjunto: 
l 2 2 3 3 4 4 4 7 9 I5 
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A moda será: 


mo = 4, 


Pois este valor se repete 3 vezes no conjunto e qualquer outro se repete duas ou menos vezes. 





2.3. MEDIDAS DE VARIABILIDADE OU DISPERSÃO 


2.3.1. A AMPLITUDE 


A mais simples das medidas de dispersão é a amplitude, anotada por “h”, e definida como 
sendo a diferença entre os valores extremos do conjunto, isto é: 


h = Xmax 7 Amin 


A amplitude do conjunto: 
-5 4 0 3 8 10, vale: 


h = Xma - Xmin = 10 - (+5) = 15. 
2.3.2. O DESVIO MÉDIO (ABSOLUTO) 


A amplitude é uma medida simples e fácil de calcular. Tem a virtude de dar uma idéia da 
variabilidade do conjunto. No entanto ela não leva em consideração todos os valores do conjunto como 
seria desejável. 


Assim prefere-se, em geral, trabalhar com medidas que utilizam toda a informação disponível. 
Uma destas medidas é o desvio médio absoluto ou simplesmente desvio médio. O desvio médio é 
representado por “dma” e definido como sendo “a média das distáncias que os valores do conjunto se 
encontram da média”. 





= = z .—X 
dma = [Ix,- Xl+Ix,- XI +... +x- XI]/n = std 


Calcular o dma do conjunto: 

-7 4 0 3 8 10 
A média é X =(-7+4+0+3+8+10)/6=18/6 =3 
Entáo o desvio médio será: 


dma = [l-7 - 31 +14 - 31 +10 - 31 +13 - 31+18 - 31 + 110 -311/6=(10+1+3+0+5+7)/6= 
26/6 = 4,33 


2.3.3. A VARIÁNCIA 


O desvio médio apesar de intuitivamente fácil de interpretar e simples de calcular náo é muito 
utilizado em Estatística. O que de fato é a medida de dispersão usual é a variância e principalmente sua 
raiz quadrada que é denominada de desvio padrão. A variância é anotada por s” e definida como sendo 
“a média dos quadrados dos desvios em relação a média aritmética.” Por desvio entende-se a 
diferença entre um valor do conjunto e a média. 
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(xix) 





S=[(x1 D+ DO + + - XY]/n=F 


Nem sempre esta expressáo é a mais indicada para ser utilizada. Quando a média é um valor 
decimal não exato ela não é muito prática, uma vez que entrará no cálculo “n” vezes aumentando os 
erros de arredondamento que ocorrem. Neste caso é melhor se valer de uma expressáo alternativa que 
pode ser derivada da expressáo acima desenvolvendo o quadrado dentro do somatório e fazendo 
algumas simplificações. 


Trabalhando inicialmente apenas com o numerador da fórmula acima vem: 
—? 2 zi E 2 + EE”, 
2 TX) = 26x —2xX+tx) = xi 2X) x 2X 


Observando que x = y. tem-se que: Y x; =nX e ainda que: $ x“=nx” vem: 
n 


+ E A nm — 
X(x X) = xi 2nx tnx =} x -nx 


6 


Dividindo este resultado por “n” e simplificando a segunda parcela vem: 


E 2 
A ox = 
= pH - sãos 
n n 
Esta é uma segunda expressão para o cálculo da variância e em muitas situações é mais 
vantajosa de ser usada. Neste caso a variância pode ser caracterizada como sendo: “a média dos 


quadrados menos o quadrado da média”. 


2.3.4. O DESVIO PADRÃO 


À variância por ser um quadrado não permite comparações com a unidade que se está 
trabalhando. Para se ter uma medida de variabilidade com a mesma unidade do conjunto utiliza-se a 
raiz quadrada da variância, que é denominada de desvio padrão. Assim a expressão para o desvio é: 





Calcular a variância e o desvio padrão do conjunto: 
-7 4 0 3 8 10 
A média é X =(-7+4+0+3+8+10)/6=18/6 =3 
Então variância será: 
s” =[(-7 -3% + (4-3 + (0-3? +3 -3 + (8-3) +(10-3)}]/6= 
= (100 + 1 +9 +0 +25 + 49)/6= 184 / 6 = 30,67 
E o desvio padrão: s = 5,54 


2.3.5. A VARIÂNCIA RELATIVA 


GA RR 2, l RAR 
A variância relativa, representada por £ é o quociente entre a variância absoluta e o quadrado 
da média. Isto é: 


2-8) Xx? 
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2.3.6. O COEFICIENTE DE VARIAÇÃO 
O coeficiente de variação é a raiz quadrada da variância relativa. Isto é: g = s / X 


Calcular a variância relativa e o coeficiente de variação do conjunto: 
-7 4 0 3 8 10 
Amédiaéx=(7+4+0+3+8+10)/6=18/6=3 
Então variância será: 
Só =107-3+ (4-32 +(0-3+(03-32+(8-32+(10-3)]/6= 
=(1004+1+9+0+25+49)/6= 184 / 6 = 30,67 
O desvio padrão será: s = 5,54 
Então a variância relativa será: 
9” = (184/6)/9=3,41 
E o coeficiente de variação será: g = s / X = 5,54 / 3 = 184,59% 
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3. DISTRIBUICOES DE FREQUÉNCIAS 


3.1. INTRODUCAO 


Para se trabalhar com grandes conjuntos de dados é necessário inicialmente agrupar estes 
dados. O agrupamento é feito em tabelas, denominadas de distribuições de freqiiéncias. Para se 
construir uma distribuição de freqiiéncias é comum fazer a distinção entre dois tipos de variáveis. A 
variável (ou conjunto) discreta (valores que são resultados de contagem) e a variável (ou conjunto) 
contínua (valores que são resultados de uma medida). Em geral variáveis discretas são agrupadas em 
distribuições por ponto ou valores e variáveis contínuas em distribuições por classes ou intervalos. 
À separação não é rígida e depende basicamente dos dados considerados. Poderá ser necessário usar 
uma distribuição por classes ou Intervalos mesmo quando a variável é discreta. 


3.2. DISTRIBUIÇÕES POR PONTO OU VALORES. 


Considere-se um conjunto de valores resultados de uma contagem. Poderia ser, por exemplo, 
o número de irmãos dos alunos da turma U, disciplina de Estatística. 


Número de irmãos dos alunos da turma U - disciplina Estatística 


3 3 


N >= =m OQ m 
A m= N 
S to n N ja 


m" Aa U A 

© m m N m 
N == Neeme 
= © a mA 
2 N m ja 

> NN UU Aà m 
SS NA = © 


3 


Esta coleção de valores não constitui informação mas pode ser transformada em informação 
mediante sua representação em uma distribuição de frequências por pontos ou valores. Para tal, coloca- 
se o conjunto em uma tabela em que a coluna da esquerda é representada pelos diferentes números 
ordenados (os pontos ou valores) e a coluna da direita pelo número de vezes que cada valor se repetiu 
(as frequências simples ou absolutas). Para o exemplo, na tabela três, tem-se: 


Tabela 03 - Distribuição de fregiiências por ponto ou valores do número de irmãos dos 
alunos da turma U. Disciplina Estatística. 


Número de irmãos Número de alunos 

0 | 7 
1 21 
2 | 8 
3 5 
4 Do 4 
5 3 
6 | 2 

Total 50 


3.3. DISTRIBUIÇÕES POR CLASSES OU INTERVALOS 


Considere-se um conjunto de valores resultados de uma medida. Poderia ser, por exemplo, a 
idade dos alunos da turma U da disciplina de Estatística. 
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Idade (em meses) dos alunos da turma U - Disciplina Estatística 


230 234 276 245 345 240 270 310 368 369 
334 268 288 336 299 236 239 355 330 247 
287 344 300 244 303 248 251 265 246 266 
240 320 308 299 312 324 289 320 264 275 
252 298 315 233 274 264 263 230 303 281 


Este conjunto de valores, obviamente não pode ser apresentado da mesma forma que o 
anterior, pois quase não há repetições. Neste caso é necessário construir uma tabela denominada de 
“distribuição de freqüências por classes ou intervalos”. Evidentemente haverá perda de informação 
neste processo, mas o ganho obtido pela facilidade compreensão dos dados compensa. 


O procedimento para construir esta distribuição envolve os seguintes passos (algoritmo): 
Y” Determinar a amplitude dos dados: h = Xmax - Xmin- 


Y” Decidir sobre o número de classes “k“ a ser utilizado. Recomenda-se um número de 
classes entre 5 e 15. Para que a decisão não seja totalmente arbitrária pode-se usar a raiz 


quadrada do número de valores como o número de classes, ou seja, k = vn. 


Y” Determinar a amplitude de cada classe. Sempre que possível manter todas as amplitudes 
iguais. Para tanto deve-se dividir a amplitude dos dados “h” pelo número de classes “k”, 


arredondando para mais, ou seja, h; = h / k. 


Y” Contar o número de valores pertencentes a cada classe. Em geral, utiliza-se a simbologia 
(I--- ), para indicar um intervalo fechado à esquerda e aberto à direita. Também poderia ser 
utilizado o intervalo aberto à esquerda e fechado à direita (---|), aberto de ambos os lados 
( --- ) ou ainda fechado de ambos os lados (l---|). 


Um exemplo de uma distribuição por classes ou intervalos é apresentado na tabela 04. 


Tabela 04 - Idades dos alunos da turma U - Disciplina Estatística. 


Idades Número de alunos 
230 |---- 250 | |2 
250 l---- 270 9 
270 |---- 290 | 8 
290 |---- 310 7 
310 |---- 330 | 6 
330 |---- 350 5 
350 |---- 370 | 3 
Total 50 


3.4. ELEMENTOS DE UMA DISTRIBUICAO DE FREQUÉNCIAS 
Além da freqiiéncia simples ou absoluta pode-se definir ainda: 
3.4.1. A FREQUÉNCIA RELATIVA OU PERCENTUAL 


A freqiiéncia relativa simples ou percentual é definida como sendo o quociente entre a 
frequiéncia simples “f;” e o total de dados “n”. 


fr, =f /n 
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Na tabela trés tem-se: 
fr3=8/50=0,16 = 16%, significando que 16% dos alunos da turma possuem 2 irmãos. 
Na tabela quatro tem-se: 


fr = 9 / 50 = 0,18 = 18%, significando que 18% dos alunos possuem idades maiores ou 
iguais a 250 meses porém menores do que 270 meses. 


3.4.2. A FREQUÊNCIA ACUMULADA SIMPLES OU ABSOLUTA. 


66.99 
1 


A frequência acumulada simples ou absoluta da linha é definida como sendo a soma das 


freqiiéncia simples ou absolutas até a linha “1 * 


F; = fi + [+ e +f; 


Na tabela três tem-se: 


F= fi + fz + fz + f4=7 +21 +8 +5 -= 41, significando que 41 alunos da turma possuem até 3 
irmãos. 


3.4.3. A FREQÜÊNCIA ACUMULADA RELATIVA OU PERCENTUAL 


66.99 
1 


A freqiiéncia acumulada relativa ou percentual da linha “1” é definida como sendo a soma das 


freqiiéncia relativas ou percentuais até a linha “1 “<. 


Fr; = fr; + fr2 + ... + fr, , ou então, como sendo o quociente da frequência acumulada simples 
pelo total de dados. 


Fr;= F; / n 


Na tabela quatro tem-se: 
Fr, = (12 + 9) / 50 = 42%, isto é, 42% dos alunos possuem idades menores do que 270 meses. 


3.4.4. OUTROS ELEMENTOS 


(i) Na tabela três os valores da coluna da esquerda são denominados de pontos ou valores. 
Cada um deles é representado por x;, onde “1” varia de 1 até k, sendo “k” o número de linhas da 
tabela. 


(ii) Na tabela quatro os valores da coluna da esquerda são denominados de classes ou 
intervalos. As classes, também, variam de 1 até k. 


Ce. 66 
1 


(11) Limite inferior da classe “1“. Anota-se por hi. 


Na tabela 4 o limite inferior da terceira classe é: 270. 


Cerco 


(iv) Limite superior da classe “1º. 
Anota-se por Is;. Na tabela 4 o limite superior da quinta classe é: 330. 


66.99 
1 


(v) Amplitude da classe “1”. Anota-se por h; e é calculada como a diferença entre os limites 
superior ou inferior da classe “1”. Assim h; = Is; - li. 
Na tabela quatro a amplitude da classe quatro é: h4 = ls, - liy = = 310 - 290 = 20 meses. 


(vi) Ponto médio da classe. Como não é possível trabalhar com classes é necessário escolher 
um representante da classe. Este representante é denominado de ponto médio da classe. E representado 
por x; e calculado por: x; = (li; + Is;) / 2 ou então x; = li; + h;/2. 
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Na tabela quatro o ponto médio da terceira classe é: x3 = (l13 + 1s3) / 2 = (270 + 290) / 2 = 280 
meses. 


Na tabela 05, abaixo, estão ilustrados os cálculos das frequências relativas percentuais, da 
freqiiéncia acumulada simples e da freqiiéncia acumulada percentual. 


Tabela 05 - Exemplos de freqiiências 


Número de irmãos Número de alunos fr, FE; Fr 


0 7 14 7 14 
1 21 42 28 56 
2 8 16 36 72 
3 5 IO 41 82 
4 | 4 8 45 90 
5 3 6 48 96 
6 | 2 4 50 ' 100 
Total 50 100 ---- =... 


3.5. APRESENTAÇÃO DE UMA DISTRIBUIÇÃO DE FREQUÊNCIAS 


3.5.1. DISTRIBUIÇÃO DE FREQUÊNCIAS POR PONTOS OU VALORES. 


Uma distribuição de freqiiéncias por pontos ou valores é apresentada graficamente através de 
um diagrama de linhas ou colunas, onde a variável “x;” é representada no eixo das abcissas (horizontal) 
e as frequências (que podem ser de qualquer tipo) no eixo das ordenadas (vertical). Veja-se um 


exemplo de diagrama de colunas simples na figura 01. 


Figura 01 - Diagrama de colunas simples da variável "número de irmãos dos alunos da 
turma U - Disciplina de Estatística" 





























3.5.2. DISTRIBUIÇÃO DE FREQUÊNCIAS POR CLASSES OU INTERVALOS 


Uma distribuição de frequências por classes ou Intervalos é apresentada graficamente através 
de um diagrama denominado de histograma. Um histograma é um gráfico de retângulos justapostos 
onde a base de cada retângulo é a amplitude de cada classe e a altura é proporcional a frequência 
(simples ou relativa) de modo que a área de cada retângulo seja igual a frequência considerada. Desta 
forma a altura de cada retângulo será igual a: fi / h; ou então fr; / hi. Veja-se o cálculo das alturas na 
tabela 06 e o exemplo na figura 02. Também pode ser construído um histograma utilizando-se as 
frequências acumuladas. Neste caso o diagrama resultante é denominado de ogiva. Se os pontos 
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médios de cada classe de um histograma forem unidos através de segmentos de retas teremos entáo um 
diagrama denominado de polígono de fregiiências. 


Tabela 06 - Cálculo das ordenadas do histograma 


Idades Número de alunos f; / hi 
230 |---- 250 12 0,60 
250 |---- 270 9 0,45 
270 |---- 290 | 8 0,40 
290 |---- 310 7 0,35 
310 l---- 330 | 6 0,30 
330 |---- 350 5 0,25 
350 |---- 370 | 3 0,15 

Total 50 ---- 


Figura 02 - Histograma de freqüência simples da variável "idades dos alunos da turma 
U - Disciplina de Estatística" 


Ofi / hi 
0,7 


0,6 
0,5 
0,4 
0,3 
0,2 
0,1 


230 |--- 250 250 |--- 270 270 |--- 290 290 |--- 310 310 |---330 330 |--- 350 350 |--- 370 


3.6. RESUMO DE UMA DISTRIBUIÇÃO DE FREQUÊNCIAS 
3.6.1. MEDIDAS DE POSIÇÃO OU TENDÊNCIA CENTRAL 
(1) A média aritmética 
A média aritmética de uma distribuição de frequências por pontos ou valores ou ainda por 


classes ou intervalos é dada por: 


X = (fixı + o e aee yE 
n 


A média da distribuição da tabela três, utilizando a tabela 07 para fazer os cálculos será: 
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Tabela 07 - Cálculo da média de uma distribuição por pontos ou valores 


Número de alunos 





50 MESA 
x = y É£iXi -95/50= 1,90 irmãos. 
n 


Ou seja, o número médio de alunos da turma U, de Estatística, é de 1,90. 


Já para a tabela quatro é necessário primeiro obter os valores dos pontos médios de cada 
classe ou Intervalo. Fazendo os cálculos na tabela 08, vem: 


Tabela 08 - Cálculo da média de uma distribuição por classes 





Número de alunos fix; 
12 2880 
9 2340 
8 2240 
T 2100 
6 1920 
5 1700 
3 1080 
50 © =- 14260 


Deste modo a média das idades será: 
X= Y 


fix 


= 14 260 / 50 = 285,20 meses, ou seja, 285 meses e 6 dias. 
n 


(ii) A mediana 
(a) A mediana de uma distribuição de valores ou pontos é obtida da mesma forma que para 
dados não agrupados, isto é: 


o Z 66,429 


Me = X(n+1)/2 Se “nº é ímpar e Me = [X(n/2) E X(n/2+1] [2 se'n” é par 
Observação: Neste caso deve-se trabalhar como se o conjunto não estivesse agrupado. 


Para os valores da tabela três a mediana é: 


Me = [X502 + Xw502+1] / 2 = [X25 + x26] / 2 = (1 + 1) /2 = 1, pois da oitava posição até a 
vigésima oitava posição todos os valores são iguais a um, e a mediana é a média entre os valores que se 
encontra na vigésima quinta e vigésima sexta posição. 
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(b) A mediana de uma distribuição de fregiiências por classes ou intervalos é dada pela 
seguinte expressão: 
-F 


Me= l1;+h; F , onde 
i 
li; = limite inferior da classe mediana, isto é, a classe que contém o ou os valores centrais; 
h; = amplitude da classe mediana; 
fi = frequência simples da classe mediana; 
F, 4 = frequência acumulada simples da classe anterior à classe mediana. 


Considerando que a classe mediana, na tabela quatro, é a que contém os valores X25 € X26, Isto 
é, a terceira classe, vem: 


n 
-F 
me.= li,+h, > = 270 + 20[(25 - 21) / 8] = 270 + 10 = 280 meses. 


(111) A moda 
(a) A moda de uma distribuição de valores ou pontos é obtida da mesma forma que para dados 


náo agrupados, ou seja, observando o valor ou os valores que mais se repetem. 


m, = valor da linha com maior frequência (se existir apenas uma). 


Para os valores da tabela trés a moda é: 
Mo = 1, pois este valor com uma freqiiéncia de 21 é o que mais se repete. 


(b) A moda de uma distribuição de freqiiéncias por classes ou intervalos é dada pelas 
seguintes expressões: 


m, = li. +h; te , denominada de moda de King, ou 
Tin 
m, = li + h; AN , denominada de moda de Kzuber, onde: 
O fia T tu 


li; = limite inferior da classe modal, isto é, a classe de maior freqiiéncia; 
h; = amplitude da classe modal; 

f; = frequência simples da classe modal; 

f;.1 = fregiiência simples da classe anterior à classe modal: 

f;,1 = freqiiéncia simples da classe superior à classe modal. 


Considerando que a classe de maior freqiiéncia, a classe modal, na tabela quatro, é a primeira, 
vem: 
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Mo= li, + h. E = 230 + 20 = 250 meses. 
2 





m= li, +h: E É | = 230 + 20[12 / (24 - 9)] = 230 + 16 = 246 meses. 


1 2 


(iv) Relação entre as três medidas de posição 

Karl Pearson estabeleceu a seguinte relação aproximada entre as três medidas de posição: 
x-m=3(X-mo, 

Ou seja, em uma distribuição de frequências à diferença entre a média e a moda é 3 vezes 


maior do que a diferença entre a média e a mediana. 


3.6.2. MEDIDAS DE VARIABILIDADE OU DISPERSÃO 


(a) A amplitude 
A amplitude de uma distribuição de fregiiências é definida como sendo a diferença entre os 
valores extremos da distribuição, isto é: 


h = Xmax - Xmin, para a distribuição por pontos ou valores e 


h = Isy- Ih, para a distribuição por classes ou intervalos. 


A amplitude da distribuição da tabela três é: 
h = Xmax - Xmin = 6 - O = 6 irmãos 
Já a amplitude da distribuição da tabela quatro vale: 
h = Is- - li, = 370 - 230 = 140 meses 
(b) O desvio médio (absoluto) 
O desvio médio absoluto de uma distribuição de freqiiéncias é dado por: 


fi 


xi- XI 





dma = [ filx,- XI + f2lX2 - XI +... + fklxn - x1]/n = 5 


O dma da distribuição da tabela três utilizando a tabela 09 para os cálculos, vale: 


Tabela 09 - Cálculo dos desvio médio absoluto 


Número de irmãos Número de alunos filxi - X| 
0 | 7 TIO - 1,901 = 13,30 
1 21 2111 - 1,901 = 18,90 
2 8 812 - 1,901 = 0,80 
3 5 513 - 1,901 = 5,50 
4 | 4 414 - 1,901 = 8,40 
5 3 315 - 1,901 = 9,30 


6 | 216 - 1,901 = 8,20 


Total 50 64,40 


N 
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fi 


xi- XI 


dma = 3 = 64,40 / 50 = 1,29 irmãos 


(c) A variância 
A variância de uma distribuição de freqüências pode ser avaliada por qualquer uma das 
expressões abaixo. 


Ae 2 
S= [f(x - X) + b- Y +.. + BO] nm prada a ys y 


(d) O desvio padráo 
O desvio padrão de uma distribuição de freqiiéncias é determinado extraindo-se a raiz 
quadrada da variância. Assim, do desvio padrão é: 


=" 2 2 
(XxX fix 
A a r 


A variância e o desvio padrão da distribuição da tabela 04, utilizando a tabela 10 para os 
cálculos vale: 


Tabela 10 - Ilustração do cálculo da variância 


2 


Idades Número de alunos Xi fix; fix 
230 l---- 250 12 240 2880 691200 
250 |---- 270 9 260 2340 608400 
270 |---- 290 | 8 280 2240 627200 


290 |---- 310 300 2100 630000 


310 |---- 330 | 320 1920 614400 


330 |---- 350 340 1700 578000 


350 |---- 370 | 360 1080 388800 


Total 50 ---- 14260 4138000 


VNA NINO 


A variância da distribuição será: 


2 

s” = y ÍiXi_ - x” = 4 138 000 / 50 - 285,20” = 82760 - 81339,04 = 1420,96 
n 

O desvio padrão vale: 


fix 
s = 49} —— -3 =37,70 


A variância relativa: g = 8” / X? = 0,0175 
O coeficiente de variação vale: g = S / X =0,132 2 = 13,22% 
3.6.3. MEDIDAS DE ASSIMETRIA 
A assimetria de um conjunto de dados, agrupados ou não, pode ser avaliada através da 


seguinte relação devida a Karl Pearson: 
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a= 3(X - me) /s 
Se a, for igual a zero então a distribuição (ou conjunto) é dito simétrico. Se a, > O então a 
assimetria é positiva significando que o gráfico da distribuição tem uma cauda alongada à direita. Caso 
a, seja negativo a cauda do gráfico será alongada à esquerda. 


Se uma distribuição de frequências é simétrica então as 3 medidas de posição coincidem, isto 


Oy 


x =m.= m.. 
Se a distribuição é positivamente assimétrica então X > Me > My 


E se a distribuição é negativamente assimétrica então X < Me < Mo 


3.7. PROPRIEDADES DAS MEDIDAS 


3.7.1. MEDIDAS DE POSICÁO 


(1) Se todos os valores de um conjunto de dados forem somados a uma constante entáo as 
medidas de posição aumentam desta constante. Em símbolos. Dado um conjunto de dados x e somando 


66,9 


a este conjunto uma constante “c”. Então para y = X + C, tem-se: 
Y=X+c 

O mesmo acontece com a mediana e a moda. 

(11) Se todos os valores de um conjunto de dados forem multiplicados a uma constante então 
as medidas de posição ficam multiplicadas por esta constante. Em símbolos. Se um conjunto de dados 
x for multiplicado por uma constante “c”. Então para Y = CX, tem-se: 

yY=CX 
O mesmo acontece com a mediana e a moda. 


3.7.2. MEDIDAS DE DISPERSÃO 


(1) Se todos os valores de um conjunto de dados forem somados a uma constante então as 
medidas de dispersão não se alteram. Em símbolos. Dado um conjunto de dados x e somando a este 


66.109) 


conjunto uma constante “c”. Então para y = X + C, tem-se: 
Sy = Sx 
O mesmo vale para a variáncia e para o dma. O coeficiente de variacáo e a variáncia relativa 
são exceções, pois são medidas derivadas, que combinam uma medida de posição a média no 


denominador que se altera e uma medida de dispersão o desvio padrão ou a variância no numerador 
que não se altera. 


(11) Se todos os valores de um conjunto de dados forem multiplicados a uma constante então 
as medidas de posição ficam multiplicadas por esta constante, sendo que a variância fica multiplicada 
pelo quadrado desta constante. Em símbolos. Se um conjunto de dados x for multiplicado por uma 


constante “c”. Então para y = CX, tem-se: 
Sy = CSx 
O mesmo vale para a o dma. Já a variância que é um quadrado fica multiplicada pelo 


quadrado da constante. O coeficiente de variação e a variância relativa são exceções, pois são medidas 
derivadas, que combinam uma medida de posição, a média no denominador que se altera, e uma 
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medida de dispersáo, o desvio padráo ou a variáncia no numerador, que também se altera. Como tanto 
o numerador quanto o denominador se alteram na mesma proporcáo, entáo a razáo entre as duas 
alterações passará a ser um. Portanto tanto a variância relativa quanto o coeficiente de variação são 
indiferentes a uma multiplicação do conjunto de valores por uma constante. 
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4. EXERCÍCIOS 


1. Identifique os tipos de escalas utilizadas para cada uma das seguintes características das unidades de 
observacáo, retiradas de uma tabela do Guia do Usuário do aplicativo Microsoft Excel: més, tipo de 
produto, vendedor, região do país, unidades vendidas e total de vendas. 


2. É possível encontrar a seguinte série de desvios tomados em relação a média aritmética: 4, -3, 2, -7 e 
5? Justifique. 


3. Dados dois grupos de pessoas, o grupo À com 10 elementos e o grupo B com 40 elementos. Se o 
peso médio do grupo A for de 80 kg e o do grupo B for de 70 kg então é verdade que o peso médio 
dos dois grupos considerados em conjunto é de 75 kg? Justifique. 


4. Um concurso realizado simultaneamente nos locais A, B e C, apresentou as médias: 70, 65 e 45, 
obtidos por 30, 40 e 30 candidatos, nessa ordem. Qual foi a média geral do concurso? 


5. Para um dado concurso, 60% dos candidatos eram do sexo masculino e obtiveram uma média de 70 
pontos em determinada prova. Sabendo-se que a média geral dos candidatos (independente de sexo) 
foi de 64 pontos, qual foi a média dos candidatos do sexo feminino? 


6. Determinar a moda dos seguintes conjuntos: 
(6.1) 1,6,9,3,2,7,4e 11 
(6.2) 6,5,5,7,5,6,5,6,3,4e5 
(6.3) 8, 4, 4, 4, 4, 6, 9, 10, 10, 15, 10, l6e 10 
(6.4) 23, 28, 35, 17, 28, 35, 18, 18, 17, 18, 18, 18, 28, 28e 18 


7. Determinar a mediana dos seguintes conjuntos: 
(7,1)9 14 2 8 7 14 3 21 1 
(7.2) 0,02 0,25 0,47 0,01 -0,30 -0.5 
(7.3) 1/2 3/4 4/7 5/4 -2/3 -4/5 -1/5 38 
8. Para os conjuntos abaixo, determinar com aproximação centesimal, as seguintes medidas: 
(a) A amplitude (b) O desvio médio (c) A variância (d) O desvio padrão (e) O coeficiente de 
variação. 
(8.1) 0,04 0,18 0,45 1,29 2.35 
(8.2) -7/4 -13 35 720 1 4/3 
9. Dados os seguintes conjuntos de valores: 
(a) 1 3 7 9 10 (Db) 20 60 140 180 200 (c) 10 50 130 170 190. 


Calculando a média e o desvio padrão do conjunto em (a), determinar, através das propriedades, a 
média e o desvio padrão dos conjuntos em (b) e (c). 


10. Quarenta alunos da PUC foram questionados quanto ao número de livros lidos no ano anterior. 
Foram registrados os seguintes valores: 

4 2 1 0 3 1 

0 2 1 1 0 4 

8 0 1 6 5 3 

3 4 3 2 1 0 2 1 


(10.1) Organize os dados em uma tabela adequada. 


N Y N 
- NV © 
© A Y N 
Ww da U m 


(10.2) Qual o percentual de alunos que leram menos do que 3 livros. 


(10.3) Qual o percentual de alunos que leram 4 ou mais livros. 
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(10.4) Classifique a variável e o tipo de distribuição utilizada. 


11. O conjunto de dados abaixo representa uma amostra de 40 elementos: 
3,67 1,82 3,73 410 430 1,28 814 243 417 288 
5,36 3,96 6,54 5,84 7,35 3,63 2,93 2,82 8,45 4,15 
5,28 5,41 7,17 4,65 1,88 2,12 4,26 2,78 5,54 6,00 
0,90 5,09 4,07 8,67 0,90 6,67 8,96 4,00 2,00 2,01 
(11.1) Agrupe os dados em uma distribuição de freqüências, considerando o limite inferior igual a 
zero, o superior igual a 10 e utilizando cinco classes de mesma amplitude. 
(11.2) Construa um histograma de fregiiências relativas. 


(11.3) Una os pontos médios de cada retângulo, obtendo o polígono de fregiiências relativas e 
classifique o conjunto quanto à assimetria. 


12. A tabela registra simultaneamente 200 aluguéis de imóveis urbanos e 100 de imóveis rurais. 
(12.1) Calcule e interprete fr, para cada caso. 
(12.2) Calcule e interprete F; para cada caso. 


(12.3) Calcule e interprete Fr, - Fr, para cada caso. 


À À P Aluguéis Zona Urbana Zona Rural 
13. O histograma abaixo representa os salários, em le TO 30 
unidades monetárias (u.m.) dos 100 empregados de 3 j5 40 50 
uma empresa: 5 l----- 7 80 15 
(13.1) Que percentual de empregados recebem 8 e, 50 05 
u.m. ou mais? 3 [== 11 20 00 
E 200 100 


(13.2) Quantos empregados recebem de 4 a 16 u.m.? 


(13.3) Quantos empregados recebem menos que 4 u.m. ou mais que 12 u.m.? 






































0|-4 4|-8 8|-12 12 |--16 16 |--20 


14. Um livro com 50 páginas apresentou um número de erros de impressão por página conforme 


tabela: 
(14.1) Qual o número médio de erros por página? 
(14.2) Qual o número mediano de erros por página? Erros Número de páginas 
(14.3) Qual o número modal de erros por página? i | — 
(14.4) Qual o desvio padrão do número de erros por página? O 
ES 
Total 50 
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15. Durante certo período de tempo o rendimento de 10 ações foram os que a 


Ação Taxa (%) 

tabela registra. 1 2.59 

(15.1) Calcule o rendimento médio. 2 2,64 

(15.2) Calcule o rendimento mediano. ) | — 

(15.3) Calcule o rendimento modal. 5 | 2,57 

(15.4) Calcule o desvio padrão do rendimento. 6 o 

o o | — NEI 

(15.5) Calcule o coeficiente de variação do rendimento. g 250 

16. Uma região metropolitana tem 50 quarteirões com os seguintes números de 9 | 263 

casas por quarteirão: 10 2,64 
2 2 3 10 13 14 15 15 16 16 
18 18 20 21 22 22 23 23 25 25 
26 27 29 29 30 32 36 42 44 45 
45 46 48 52 58 59 61 61 61 65 
66 66 68 75 78 80 89 90 92 97 


(16.1) Construa, com os dados, uma distribuicáo de freqiiéncias por intervalos fazendo com que as 
classes tenham amplitudes igual a 14. 


(16.2) Calcule o número médio de casas por quarteirão. 
(16.3) Determine o número mediano de casas por quarteirão. 
(16.4) Calcule a variância do número de casas por quarteirão. 


(16.5) Calcule, pêlos dois processos, o número modal de casas por quarteirão. 


17. De um levantamento feito entre 100 famílias resultou a tabela ao lado. Determine: 
(17.1) O número médio de filhos. 
(17.2) O número mediano de filhos. 
(17.3) O número modal de filhos. 
(17.4) O desvio padrão do número de filhos. 


Número de filhos Número de famílias 
18 


BON AO 
XO) 
Oo 


18. As informações abaixo dizem respeito a distribuição 


de três variáveis. Indique, justificando, qual delas tem ; i 
média mais representativa. Total Ane 
Distribuição A Distribuição B Distribuição C 
n = 200 n = 50 x=8 
2 fx = 5000 > fx = 500 > fx = 3200 
Xfx” = 130000 Xfx” = 5450 Xfx” = 32000 
19. Identifique, justificando, qual a variável mais homogênea. 
Distribuição A Distribuição B 
n = 100 x =50 
> fx = 5000 2 fx = 10000 
Nx” = 256400 f(x - x)"=7200 


20. Uma variável x tem média igual a 10 e variáncia igual a 16. Calcule a média e a variáncia da 
variável dada por y = (3x + 5) /2 
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21. Uma variável x tem média igual a 5 e desvio padrão igual a 3. Calcule o coeficiente de variação da 
variável y = 4x + 4 

22. Uma variável x tem média igual a 6 e coeficiente de variação igual a 0,50. Calcule o coeficiente de 
variação da variável y = (5x - 2) / 2 

23. Os operários de um setor industrial têm, em uma época 1, um salário médio de 5 salários mínimos 
(sm) e desvio padrão de 2 sm. Um acordo coletivo prevê, para uma época 2, um aumento linear de 
60%, mais uma parte fixa correspondente a 70% de um salário mínimo. Calcule a média e o 
desvio padrão dos salários na época 2. 


24. Uma variável x assume valores no intervalo [10; 30]. 


(23.1) Sabendo que x tem uma distribuição assimétrica positiva você diria que a média de x é: 20, 
menor que 20 ou maior que 20. Justifique. 


(23.2) E se x tiver uma distribuição simétrica? 


25. O que se pode dizer se fosse dada a informação de que o salário mediano de um conjunto de 
profissionais é de 6 sm? 


26. Um a comunidade A tem 100 motoristas profissionais cujo salário médio é de 5 sm. A comunidade 
B, com 300 desses profissionais, remunera-os com uma média de 4 sm. 


(25.1) É correto afirmar que A remunera melhor seus motoristas profissionais que B? 


(25.2) Diante das informações disponíveis há garantia que os 100 salários individuais de A são 
maiores que os 300 de B? Por que? 


27. Abaixo você encontra duas distribuições que refletem os comportamentos de x e y (tamanhos de 
famílias) em duas comunidades, sendo que uma de base cultural alemã e outra italiana. Utilize tais 
Informações para uma análise que indique qual das duas comunidades tem famílias maiores. 


X f Y f 
2 | 25 3 48 
3 30 4 51 
4 | 48 5 48 
5 111 6 41 
6 | 98 1 32 
í 88 8 14 

9 6 


28. O departamento de pessoal de um certa firma fez um levantamento dos salários dos 120 
funcionários do setor administrativo, obtendo os resultados da tabela: 


(28.1) Determine o salário médio dos funcionários 

(28.2) Determinar a variáncia e o desvio padráo dos salários. 

(28.3) Determinar o salário mediano. 

(28.4) Determinar o salário modal pélos critérios de King e Czuber. 


(28.5) Se for dado um aumento de 20% para todos os funcionários, qual será o novo salário médio 
e o novo desvio padrão dos salários” 


(28.6) Se for dado um abono de 0,5 s.m. a todos os Faixa salarial (s.m.) ~% de funcionários 

funcionários como fica a média e o desvio padrão dos MS | 0,25 

salários? - E j E 
29. O que acontece com a média e o desvio padrão de um 71-10 0.1 5 


conjunto de dados quando: Total | 1,00 
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(29.1) Cada valor é multiplicado por 2. 

(29.2) Soma-se o valor 10 a cada valor. 

(29.3) Subtrai-se a média de cada valor. 

(29.4) De cada valor subtrai-se a média e em seguida divide-se pelo desvio padrão 


30. A média aritmética entre dois valores é igual a 5 e a média geométrica igual a 4. Qual a média 
harmônica entre estes dois valores? 
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5. RESPOSTAS DOS EXERCÍCIOS 


(01) Més (Qualitativa ordinal) ; Tipo de produto (Qualitativa nominal); Vendedor (Qualitativa 
nominal); Regiáo do país (Qualitativa ordinal); Unidades vendidas (Quantitativa discreta); Total de 
vendas (Quantitativa contínua). 


(02) Náo, pois a soma dos desvios é diferente de zero. 


(03) Náo, pois o cálculo deve ser realizado através da média ponderada e náo da média aritmética 
simples. 


(04) 60,50 

(05) 55 

(06) (6.1) Amodal (6.2) 5 (6.3)4 e 10 (6.4) 18 

(07) (7.1) 8 (7.2) 0,02 (7.3) 7/16 

(08) (8.1) (a) 2,31 (b) 0,77 (c) 0,74 (d) 0,86 (e) 99,90% 
(8.2) (a) 37/12 = 3,08 (b) 149/180 = 0,83 (c) 1,03 (d) 1,02 (e) 508,01% 


(09) Observe que o conjunto em (b) é igual ao conjunto em (a) multiplicado por 20 e o conjunto em (c) 
é igual ao conjunto em (a) multiplicado por 20 e subtraído de 10 unidades. 


(10) (10.1) Número de livros Número de alunos (10.2) 24/40 = 60% 
| 
























































































































































0 | 7 
1 9 (10.3) 9/40 = 22,5% 
| 2 | 8 
a 4 (10.4) Distribuição por ponto ou valores 
| 4 | 4 
5 2 
| 6 | 2 
8 1 
| Total | 40 
(11) (11.1) Variável Freqiiências (11.2) 
pq) 5 
Ez 12 
[dp] 14 
gire 5 
PES ls 107] 4 
y 40 
(11.3) Assimétrica positiva 
0,2100 
0,1800 
0,1500 
0,1200 
0,0900 
0,0600 
0,0300 
0,0000 
4 1 3 5 7 9 11 
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(12) (12.1) Zona urbana: fr, = 0,20 > 20% dos aluguéis observados estão entre 3 e 5. 
Zona rural: fr, = 0,50 > 50% dos aluguéis investigados ente entre 3 e 5. 
(12.2) Zona urbana: F; = 130 > 130 aluguéis investigados são menores do que 7. 
Zona rural: F3 = 95 > 95 aluguéis investigados são menores do que 7. 
(12.3) Zona urbana: Fry - Fr, = 0,90 - 0,25 = 0,65 = 65% dos aluguéis estão entre 5 e 9. 
Zona rural: Fr, - Fr, = 1,00 - 0,80 = 0,20 = 20% dos aluguéis estão entre 5 e 9. 


(13) (13.1) 64% (13.2) 76 (13.3) 56 
(14) (14.1) 0,66 erros (14.2) 0,50 erros (14.3) Zero erros (14.4) 0,84 erros 
(15) (15.1) 2,60% (15.2) 2.60% (15.3) 2,64% (15.4) 0,04% (15.5) 1,63% 
(16) (16.1) | Número de casas por quarteirão | Número de quarteirões 
02 l----- 16 8 
| 16 l----- 30 | 16 
30 |----- 44 4 
| 44 l----- 58 | 6 
e To 9 
| qu pa o | 3 
86 |----- 100 4 
| | 50 
(16.2) 41,76 casas (16.3) 33,50 casas (16.4) 686,86 casas (16.5) 20,67 e 21,60 casas 
(17) (17.1) 1,85 filhos (17.2) 2 filhos (17.3) 2 filhos (17.4) 1,30 filhos 


(18) É a variável A cujo coeficiente de variação é 0,20, o menor dentre as 3. 


(19) É a variável B cujo coeficiente de variação é 0,12, o menor dentre as 2. 


(20) x = 17,50 s” =36 (21) g = 50% (22) g = 0,5357 = 53,57% 
(23) x =8,/0sm  s=3,20sm 

(24) (24.1) Deve ser maior que 20. (24.2) Seria 20, pois 20 é o centro da distribuição. 

(25) Que 50% dos profissionais recebem até 6 sm. (26) (26.1) Sim, em média. (26.2) Não. 


(27) A comparação pretendida deve ser feita pelas médias. As famílias de base cultural alemã tem, em 
média, 5,23 membros, enquanto que as de base italiana tem 5,10. Então as de base alemã tem o 
hábito de ter famílias maiores. 


(28) (28.1) 4,58 sm (28.2) 4,51 e 2,12 sm (28.3) 4,25 sm (28.4) 3,89 sm e 3,86 sm 
(28.5) 5,49 e 2,55 sm (28.6) 5,08 e 2,12 sm 

(29) (29.1) A média e o desvio padráo ficam multiplicados por 2. 
(29.2) A média fica somada de 10 e o desvio padrão não se altera. 


(29,3) A média fica 1gual a zero e o desvio padráo náo se altera. 


(29.4) A média fica igual a zero e o desvio padrão fica igual a um. 
(30) 3,2 
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